Поиск текстов, не соответствующих тематике и нахождение похожих статей

У меня есть сайт со статьями схожей тематики. На сайте было две проблемы: спамерские сообщения и дубликаты статей, причём дубликаты часто являлись не точными копиями. Данный пост повествует о том, как я решил эти проблемы. Дано: общее количество статей 140 … Читать далее Поиск текстов, не соответствующих тематике и нахождение похожих статей